【Informatica】Runtime Continuity を理解して適切にメジャーアップデートに備えよう
はじめに
データ事業本部の川中子(かわなご)です。
Informaticaで定期的に行われるメジャーアップデートですが、
システムに大きなアップデートが入るときって、なんとなく身構えてしまいますよね。
もしアップデート中に稼働しているジョブが全停止してしまったらと思うと、怖くて夜しか眠れません。
今回はそんな不安を解消する手助けをしてくれる便利な機能、Runtime Continuity のご紹介です。
Runtime Continuityのドキュメント確認
Runtime Continuityに関する記述は以下の資料から確認できます。
一部、機能の説明に関する内容を抜粋していきたいと思います。
4ページ:Deployment window
日本語訳:
対象サービスの場合、スケジュール済みまたは実行中のタスクやプロセスへの影響はありません。
対象サービスでない場合、配置後にタスクを再起動する必要があります。ディプロイメントウィンドウの前に開始された長時間実行タスクは、その後24時間まで実行され続けます。
タスクの実行時間が長い場合は、その24時間以内に再起動する必要があります。詳細については、PODアップグレードのランタイム継続を参照してください。
組織とPODの配置スケジュールを確認するには、イベントページを参照してください。
7ページ:Runtime continuity for POD upgrades
日本語訳:
サービスによっては、メジャーリリース時にランタイムの継続性があります。
ランタイムの継続性により、デプロイメントウィンドウの間、サービスを継続して使用することができます。サービスにランタイム継続性がある場合、アップグレード中にジョブの実行を停止したり、
スケジュールされたジョブを無効にしたり、ブラックアウト期間を設定したりする必要はありません。
プロセスの実行、外部化された接続を使用するジョブの実行、API 呼び出しの受け付けを継続できます。
また、外部スケジューラ、IDMC REST API、およびRunAJobユーティリティの使用も可能です。これらのジョブは、デプロイメントウィンドウの間も正常に実行されます。
以下のサービスと機能にはランタイム継続性があります:
- Advanced Serverless
- Data Quality, including Advanced
- API Center
- Human Task Workflow
- API Manager & Gateway
- INFACore
- Application Integration
- Integration Hub (hosted publication repository)
- Data Integration, including Advanced
- Mass Ingestion (Files)
- Data Profiling, including Advanced
- Model Serve
サービスや機能にランタイムの継続性がない場合は、デプロイメントウィンドウの前にジョブの実行を停止し、
スケジュールされたジョブを無効にしてください。可能であれば、ブラックアウト期間を設定してください。
デプロイが始まったら、アクティブな開発を一時停止します。
Runtime Continuityの仕様
ドキュメントから確認できる仕様について、要点だけまとめてみます。
- 対象サービスで稼働しているジョブについては スケジュール変更などの対応が必要ない
- デプロイメントウィンドウから 24時間を超えて稼働するジョブは対応 が必要
- Runtime Continuityが適用されるサービスは以下の通り
- Data Quality, including Advanced
- API Center
- Human Task Workflow
- API Manager & Gateway
- INFACore
- Application Integration
- Integration Hub (hosted publication repository)
- Data Integration, including Advanced
- Mass Ingestion (Files)
- Data Profiling, including Advanced
- Model Serve
対象になっているサービスでは、特にスケジュール変更やブラックアウト期間の設定が必要なく、
もし24時間を超えて稼働するようなジョブがある場合は、そのジョブだけ対応が必要になります。
対象のサービスだけ稼働しているような環境では、準備が少なくなってとても便利ですね。
注意点
特にスケジュール変更などの対応が不要になる便利な機能ですが、注意点もあります。
参考に以下のFAQ記事をご紹介します。
メジャーアップデートから24時間は2つのバージョンの機能を維持しているため、
その間は通常時に比べてメモリの使用量が増加するよ、という内容です。
メジャーアップデートの実施前には、サーバーに十分なメモリが確保されていることを確認しましょう。
メモリに関する記述はありませんが、ディスク容量についてはメジャーアップデート時に公開される
What's Newの中に、確保しておく必要がある具体的なディスク容量についての説明があります。
日本語訳:
各Secure Agentマシンに、アップグレードに使用できる十分なディスク領域とメモリがあることを確認します。
2つの Secure Agent を同時に実行するには、マシンに十分なメモリが必要です。
マシンには少なくとも5GB、または次の式で計算されたディスク容量の大きい方が必要です。
必要な最小空き容量 = 3 * (現在のSecure Agentインストールディレクトリのサイズ - ログディレクトリに使用される容量)
さいごに
自動的にジョブの継続性を担保してくれる便利な機能ですが、
Informatica Cloudのホストサーバーで大きな変更が行われていることには変わらないので、
平常時には発生することがあまりないような障害が発生する可能性 も十分にあります。
24時間とまではいかずとも 長時間の稼働が見込まれるジョブ や、
もし リカバリが必要になった際に膨大なリソースを必要とするようなジョブ については、
念の為スケジュール変更やブラックアウト期間を設定しておくというのが、安全な選択かも知れません。
また一時的にメモリの使用量も通常時より増加してしまうので、
対象時間にサーバーで稼働しているタスクについてはやはり注視しておく必要 がありそうです。
以上、Runtime Continuityのご紹介でした。
記事を最後まで読んで頂き、ありがとうございました。